网络首发 | 生成式智能出版的技术原理与流程革新
网络首发时间
2023-07-17
网络首发地址
https://kns.cnki.net/kcms2/detail/42.1085.g2.20230716.0031.002.html
Photo by Martin Martz on Unsplash. |
张新新
上海理工大学出版印刷与艺术设计学院,上海,200000
丁靖佳
武汉大学信息管理学院,武汉,430072
目的 | 意义 | 探索生成式人工智能技术赋能出版业所形成的生成式智能出版的技术原理,基于分析式智能出版与生成式智能出版的范畴结构,研究生成式智能出版在内容生产、内容审校、智能印刷、智能营销四个环节的流程革新。 | |
研究设计 | 方法 | 以ChatGPT为视角,分析了ChatGPT生成式智能、认知智能以及通用人工智能三个方面的本体属性界定,揭示其具有的海量数据优势、强化学习算法优势和持续超强算力优势三个关键技术原理,论述了基于生成式人工智能的智能出版流程革新。 | |
结论 | 发现 | 生成式智能出版流程革新的意涵包括从专业生产内容到人工智能生产内容、从人工编校到人机协同智能编校、基于生成式智能的按需印刷、智能印刷厂等印刷场景创新以及基于生成式智能的营销数据、能力、效率和质量变革。 | |
创新 | 价值 | 对以ChatGPT为代表的优化对话语言模型产品进行了生成式智能、认知智能和通用人工智能阶段成果的本体界定,提出了生成式智能出版在策划、编校、印制和发行环节的新特点、新规律和新设想,一定程度拓展了数字出版、智能出版的研究范畴。 | |
关键词 | ChatGPT;智能出版;生成式人工智能;智慧出版;数字出版;元宇宙出版;人工智能生成内容 |
2022年11月,美国OpenAI公司发布大型语言模型(large language model,LLM)ChatGPT,其在推出5天后注册用户量超百万,2个月后的月活用户量突破1亿,成为“史上用户增长速度最快的消费级应用程序”,成功引爆科技圈并持续“火出圈”,引发了国内外不同领域对人工智能(Artificial Intelligent, AI)的关注、思考和讨论。基于ChatGPT的自述(询问于2023年4月26日),其能够“处理和生成超过25种编程语言和超过100种自然语言文本,且这个数字还将因不断更新和改进的训练数据和模型而有所变化”,提供“语言生成、语言理解、语言翻译、文本摘要生成、代码生成、情报分析、学术论文自动撰写、新闻报道自动撰写”等多项服务。无疑,ChatGPT是继“深蓝”、Watson、Alpha Go之后,AI领域的又一“明星级代言”应用,推动了AI技术和应用的纵深发展。
就ChatGPT的本质来看,其具有以下几个属性或特征:(1)生成式AI。在分析式AI和生成式AI这一组范畴中,ChatGPT属于生成式AI,即是基于算法、模型、数据、算力和规则等生成不同类型文本内容的LLM。2022年之前,新闻出版业所接触和应用的多为分析式AI,旨在通过海量数据发现固定模式,以实现内容推荐、智能检索、图像识别、机器翻译等。(2)认知智能。AI的发展路径大致遵循“感知智能→认知智能→情感智能→行为智能”的逻辑,分别对应AI1.0、2.0、3.0和4.0阶段。感知智能主要指机器通过各种传感器及技术模拟人的视觉、听觉、触觉等感知能力,从而进行语音、图像识别等。随着AI的高速增长和全面扩张,能听、会说、会看的“感知智能”正逐渐向具有理解和表达能力的“认知智能”转变。ChatGPT所表现出来的智能,便是具有类人的学习、语言、理解、推理和决策能力的高级智能,是认知智能的具体化。其核心算法,即基于人类反馈的强化学习Instruct 模型,能够解决内容输出的适人化问题,使生成内容符合人类表达和语言逻辑,并尽可能的与人类认知、需求、价值观等相一致。(3)通用人工智能(artificial general intelligence, AGI)。限制领域人工智能(artificial narrow intelligence, ANI),通常指专注于完成单项特定任务、解决具体领域问题的AI,而AGI则可以胜任人类所有工作,是能够像人类一样感知、认知、决策、执行和负责的AI。在这方面,ChatGPT更多具有AGI的属性和特征,基本能够像人一样完成问答、撰文、创作等任务,但又不完全是AGI。准确地说,ChatGPT是将AI从单一领域扩展到若干领域,但还未覆盖全领域,是从ANI向AGC过渡的AI模型,也是未来强AI实现的一个雏形。
因此,在AI领域,ChatGPT属于创造性更强、自主性更大、智能化程度更高的生成式智能和认知智能,并具有AGI的性质和特征。以ChatGPT为代表的生成式 AI,也将深刻影响新闻、出版、图书情报等领域,在为其带来发展机遇的同时也提出了一系列挑战。就出版而言,这些挑战至少包括如何发挥ChatGPT在出版领域的应用活力,如何规制其可能产生的著作权风险、伦理风险、文化安全风险等。鉴于此,需从ChatGPT的发展沿革及功能出发,了解以ChatGPT为代表的生成式AI的技术特点与应用潜力,进而探析其对出版发展的多维影响。如此才能有效把握以ChatGPT为代表的生成式AI应用及其背后的生成式AI技术的发展特征,并以技术预见视角洞察未来出版的发展趋势,以达到理论引领实践、理论预判并规制风险发生的效果。
1 ChatGPT 的发展沿革与功能 |
从发展历程来看,ChatGPT主要经历了以下发展阶段:(1)基于GPT3.5的预训练期。OpenAI在2022年初完成了生成式预训练转换模型(generative pre-trained transformer,GPT)3.5的训练,该模型包含1750亿个参数和1000GB的数据集,可以通过少量的提示语或直接询问生成各种类型和风格的文本,是ChatGPT强大的语言理解和文本生成能力形成的基础。(2)基于人类反馈的强化学习期。OpenAI利用人工智能教练(AI trainers)提供的对话数据,对GPT3.5模型进行了有监督的微调,使其能够以对话模式与用户交互。同时,OpenAI也收集了人类教练对不同模型回答的评价数据,用于构建奖励模型(reward model),并利用近端策略优化(proximal policy optimization,PPO)算法对其进行强化学习,使ChatGPT能够更好地适应不同的对话场景和主题。(3)研究预览和公开测试期。OpenAI于2022年11月发布了ChatGPT的研究预览,邀请公众在其官方网站上进行免费试用,希望通过这种方式收集用户的反馈和建议,在进一步发现ChatGPT优势和局限的基础上进行改进和拓展。未来,OpenAI还将积极探索 ChatGPT的低成本应用和商业化拓展,以不断增强ChatGPT在不同领域的可用性和实用性。
在功能上,ChatGPT的主要功能早就在大众对其的冠名之中呈现出了不同的面向。ChatGPT自称是 “优化对话语言模型”(optimizing language models for dialogue)。不同领域学者则称之为“对话系统”“聊天预训练生成模型”“人工智能聊天机器人”“生成型预训练聊天机器人”“对话式AI机器人”“人机对话应用程序”“聊天机器人程序(文字版的AI语音助手)”等。综合以上种种,ChatGPT的主要功能包括:其一,智能回答。基于海量数据、强大的逻辑推理能力和适人化的表达习惯,对用户提出的个性化、差异化问题,输出更真实、更有效、更加适配的答案。其二,内容创作。能够实现论文撰写、创意写作、新闻稿件撰写、诗歌创作等。其三,代码编写。通过分析数据执行特定编程任务,如开发相应的AI软件代码等,起到以“人工之智能构建人工智能”的效果。其四,内容翻译。能够实现多种语言之间的切换翻译,用于著作翻译或多语种教学等。其五,教育辅导。一方面为学生用户提供个性化、定制化的课程资源、辅导材料或试题等;另一方面,根据教师用户的特定需要,提供教学所需的内容资源、经典教学案例或学生就业指导参考资料等。
2 生成式智能出版的技术原理 |
智能出版,是指以智能化的数字技术对作品进行编辑加工后,经过复制发行的新型出版。在《智能出版:现代出版技术原理与应用》一书中,笔者重点分析了出版流程智能再造、出版大数据、出版知识服务、增强现实出版、虚拟现实出版、基于5G的出版、基于区块链的出版以及基于智能机器人的出版应用等,基本勾勒出了智能出版的轮廓。随着GPT等生成式AI技术的进一步发展和迭代,生成式智能出版这一智能出版的新业态也呼之欲出,并将在出版业的内部流程智能变革和外部产品服务智能化两方面展现出新特点和新趋势。
生成式智能出版,是基于生成式AI技术而出现的新型出版业态或新出版阶段。生成式智能出版的技术底座是生成式AI技术,其技术原理由数据、算法和算力三个部分组成,如图1所示,本文以ChatGPT及其背后的技术原理为基础作进一步的阐释。
图1 生成式AI 技术的技术原理 |
2.1 海量无标注文本数据和高质量人工标注数据优势
数据是能源,是生产要素,是基础,也是训练语料。“语料体系是语言模型的基础”,海量的、高质量的、大规模的语料是ChatGPT得以应用的基础,也是生成 式智能出版的关键要素之一。
目前,ChatGPT的训练语料或数据来源有两类。一是无标注文本数据。即从网页、WebText2、图书、维基百科等渠道搜集的约3000亿单词语料,经过数据清理后形成超过1750亿的巨量无标注文本数据;通过对海量无标注语料的预训练和学习,ChatGPT能够熟练掌握复杂的语言表达模式、文字前后逻辑、知识元关系等知识内容,而这是其对话能力得以增强的前提和基础。二是有标注文本数据。ChatGPT融入了由40名标注人员主导的、数万高质量的、符合人类偏好的人工标注数据,以推动ChatGPT成为“听得懂人类语言、自身拥有判断标准的LLM”。同时,通过对高质量标注数据的针对性微调,ChatGPT的对话能力进一步增强。某种程度而言,40位专家的参与,是人类智慧和机器智能的融合、人工评分和奖励模型的融合,赋予了ChatGPT“人格”,最终实现了ChatGPT输出的人性化和适人化。
2.2 基于人类反馈的强化学习算法优势
就算法而言,GPT3.5模型为ChatGPT提供了技术支持。GPT是一种基于互联网可用数据训练的文本生成深度学习模型,采用“基于人类反馈的强化学习技术”(reinforcement learning with human feedback, RLHF),即基于奖励模型和近端策略优化模型进行训练,实现人类和机器的相互问答并不断对其算法加以迭代,“使模型逐渐具有对生成答案的评判能力”。评判的标准是适人化,即ChatGPT的输出与人类常识、常情、常理是否一致,与人类的认知、需求和价值观是否一致。具体而言,RLHF的训练过程由预训练语言模型训练、打分模型训练和基于强化学习的语言模型优化三个步骤构成。
预训练语言模型训练。即使用无监督学习算法对大规模文本数据集进行训练,以学习、理解和生成自然语言,形成自然语言的复杂意图理解、因果关系判断以及特定文本摘要抽取等功能。
打分模型训练。该阶段设置奖励模型,利用标注好的数万条人类偏好数据,进行有监督的代码微调和指令微调,旨在评估模型的输出是否符合人类表现以及表现的优劣,从而推动输出内容更接近人类表现。
基于强化学习的语言模型优化。基于上述训练好的奖励模型,使用强化学习PPO算法来优化ChatGPT、最大化奖励,建构生成思维链(chain-of-thought)进行复杂推理,以提高ChatGPT“知道知道”“知道不知道”的能力,减少“不知道知道”“不知道不知道”的限制,并通过逐步思考以帮助其回答不知道的问题。
2.3 持续超强算力支持
在AI三要素之中,数据代表着生产要素或生产资料,算法意味着新的生产关系,算力则表征着新的生产力。算力水平的高低、强弱决定着算法作用的发挥和数据处理能力的大小。
ChatGPT能够成为AI发展的里程碑式成果,离不开超强算力的支撑。在算力方面,ChatGPT使用的GPT3.5模型在微软云计算服务Azure AI的超算基础设施上训练,总算力消耗约为3640PF-days(按每秒一千万亿次计算,须运行3640天)。语料训练和模型运行也需要庞大的算力,有研究估测,完成GPT3的训练,需要有上万个英伟达CPU/GPU24小时不间断输入数据,或者说需要7-8个投资规模在30亿、算力500P的数据中心才可支撑其运行,一次运算要花费450万美元,且算力需求每两个月都会翻一番。此外,据称新一代GPT5大模型正在25000个英伟达GPU上训练,换言之,需要几万片英伟达计算设备的算力支持。
3 生成式AI推动出版流程智能革新 |
“从人工智能的视角审视出版业,流程再造、流程重塑将会首当其冲,以大量的自动化、智能化系统取代人力资源的投入将会成为主要趋势”。基于上述生成式AI数据、算法和算力的优势,生成式智能出版较以往智能出版,在出版流程内部变革方面将带来一些新的启迪和思考。一般而言,智能出版流程涉及智能选题策划与协同撰稿、智能审校、智能印刷、智能发行等,覆盖内容生产、编辑加工、复制印刷、营销传播四个关键环节。在生成式AI技术发展的背景下,生成式智能出版在内容生产方式、编校方式、印刷场景和发行营销等方面都将呈现出新特点和新趋势,如图2所示。
图2 生成式AI推动出版流程革新示意图 |
3.1 由专业生产内容到人工智能生产内容
历经二十年数字出版的蓬勃发展,出版业的内容生产方式逐渐由专业生成内容(professional generated content, PGC)向用户生成内容(user generated content, UGC)转型,并在生成式AI技术的加持下,进一步升级至人工智能生成内容(artificial intelligence generated content, AIGC)。AIGC可视为是从内容生产者视角进行分类的一类内容、一种内容生产方式,或者说是用于内容自动化生成的一类技术集合,具有内容属性、主体属性和技术属性。
上述内容生产方式的“转型”“升级”并不意味着PGC完全被UGC、AIGC取而代之,而是强调内容生产方式的多元化、内容生产体系的健全化。一如数字出版不是对传统出版全然颠覆,而是丰富出版业的产品供给、技术供给和用户体验供给,实现技术与出版的深度融合,进而推动出版业的高质量发展。出版实践也证明,PGC在当前仍然占据着内容生产的主流和统治地位,并没有因UGC或AIGC的出现而受到动摇或撼动。
在ChatGPT背后的生成式AI技术的赋能下,AIGC的出版产品数量和质量将会得到质的提升,同时也会引起PGC、UGC出现新的变化。
首先,AIGC规模、效率、模态和质量的跨越式发展,将深远影响出版业的内容生产。在内容规模方面,较传统的机器撰稿、机器人新闻,AIGC支持长文档搜索分析和咨询、超长文本对话和长文本构建,所输出的内容长度有了质的突破;而以往机器人撰稿仅局限在数百字的客观性事实报道,如财经新闻、地震新闻、体育新闻等。在输出效率方面,AIGC的输出时间大为缩短,已可以在10秒内架构一个网站、60秒设计一个游戏,仅一次对话便可产生一部剧本或短篇小说。事实上,早在2018年,微软小冰聊天机器人便可用不到4秒的时间创作完成40行的长诗歌《致十年后》,ChatGPT的创作效率则有过之而无不及。在内容模态方面,AIGC已经可以同时支持生成包含文字、图片、音频、视频等在内的多模态内容,也可以面向增强现实出版物提供3D模型、面向虚拟现实出版物提供数字化虚拟环境,真正做到了基于知识体系的多模态内容输出。在输出质量方面,高精准的图像识别,基于文献提炼摘要,堪比人类水平的法律、数学和语言考试等,均彰显出AIGC的高水平学习、理解、推理和表达能力。AIGC算法中蕴藏的归纳、总结、推理等思维能力甚至已经超出了大部分人类的水平,某种程度而言具有了强AI的特征。
鉴于AIGC上述的卓越表现,出版业的内容生产理念、制度和实践也会受到长远影响。一则,在出版业的内容生产理念中,“作者”可能会被颠覆或被重新诠释。未来的知识生产或知识的原材料生产、直接生产、个体化生产的主体,将不仅仅局限于“自然人”或“法人”,而是将扩展至AI、机器,需要深入研讨的是AI能否成为著作权主体,可否赋予人格。二则,出版业内容生产制度体系亟待重塑和重整:(1)在内容直接生产方面,需在发展以往依靠出版社人力资源所进行的自编书制度的同时,扩展基于AI的自编书制度,以不断提升出版机构自主知识产权的比例;(2)在内容组织方面,除传统的策划、约稿或接受自投稿制度以外,须建立面向AI的策划、约稿或接受其自投稿的内容生产制度;(3)在内容审校方面,出版业作为内容选择产业,除进一步发挥好人力审校制度的作用以外,人机协同审校制度将因适应数字化、智能化发展需要而得以建立并不断完善。三则,出版业的内容生产实践将经常出现AI协助创作、辅助创作、自主创作的事例,输出AIGC、AI协同专业生成内容(AIPGC)、AI协同用户生成内容(AIUGC)等多元内容类型。事实上,早在ChatGPT出现以前,施普林格 • 自然(Springer Nature)、电子工业出版社、北京联合出版公司等国内外出版机构已 纷纷涉足AI生成图书的出版领域,陆续出版《锂离子 电池:当前研究的机器生成摘要》《CRISPR――计算机生成的文献综述》《极简区块链》《阳光失了玻璃窗》等AIGC出版物。在2021年,人民法院出版社依托法信 大数据平台与图书编辑部合作,借助知识体系和智能串联的优势,从数据库中调取结构化、专业化的法律条目和知识元,在数周时间内从资源中台中导出生成 了《智慧办案手册》图书初稿,直接变革和颠覆了书稿创作模式,推动出版社由传统的“编校印发”流程向着 “创编校印发”的流程变革甚至是流程革命。目前,这场深远的组织流程革命仍在路上。
其次,UGC与AIGC协同发力,将推动作品质量进一步提升和优化。UGC的出现,降低了内容生产者的进入资质和门槛,扩大了内容生产者队伍,也进一步丰富和满足了人们的学习、阅读、审美和陶冶情操等需要。其中,网络文学便是数字出版业中最典型的UGC业态。ChatGPT的出现,意味着AIUGC这一新业态的萌芽。事实上,AIUGC将扩大UGC作品的数量规模,提高UGC作品的产出效率,提升UGC作品的品质和结构,实现创作图文声像影多模态融合的优质UGC作品,进而推动UGC作品更好地满足人们个性化、定制化、多元化的精神文化需要。
最后,PGC联手AIGC,将形成PGC与AIGC共存共生的内容生产新格局。一直以来,PGC以其精准、可控、高质量、高可信度而居于内容生成体系的主流地位。但较之UGC、AIGC,PGC的生产效率相对较低,产品规模始终局限于一定的体量而难以实现新的跃升,比如我国图书出版总册数始终在50万种左右,新书品种数近年来一直在20-26万种。同时,PGC作品的质量也受制于编辑素养和能力,这就意味着并非所有的PGC作品的质量和水平天然高于AIGC作品,在体系化、整合性、集成创新等方面,PGC作品较AIGC作品逊色不少。随着生成式AI 技术赋能出版业的范围越广、程度越深、时间越久,PGC和AIGC之间的融合趋势将会更加明显,基于AI的PGC将会陆续出现并不断得到创新发展,如AI协助专业生产内容、AI辅助专业生产内容等AIPGC形式将兼采PGC专业化、高质量和AIGC高效率、大规模、多模态、整合创新的优势,推动包含出版业在内的内容产业实现创新、可持续和高质量发展。
3.2 从人工编校到人机协同智能编校
ChatGPT对出版流程所带来的影响,除了内容生成、内容组织(选题策划)以外,还包括编校环节。AIGC出版物的大量出现,对传统编校模式提出了挑战,也推动着人机协同编校理念更新、模式更新和路径更新。
随着生成式智能时代的到来,PGC将在其中扮演愈发重要的角色;“ AI+人工”的内容审核机制将成为产业主流,机器审核的重要性不言而喻。传统审校模式,基本上都是以人工审核为主,由责任编辑、文字编辑来承担三审三校的主要职责。“黑马校对”等校对软件主要起到的是辅助作用,基本局限于错别字、语法语式、标点符号等方面,而对于内容润色、提升、改写等较深层次的审核和把关,则显力有不逮或是无能为力。生成式智能出版到来以后,“人工为主、软件为辅”的审校模式面临诸多挑战:一则,AIGC出版物的内容系基于海量数据编排、整合的结果,其观点的原创性、可版权性、真伪性等,往往难以通过人力加以判断;二则, AIGC输出内容之速度、效率、规模是难以估量的,仅仅依靠数量有限的编辑劳动力进行审核将难堪重负;三则,基于AIGC输出的数据、信息和知识,其更新之速度、创新之程度、革新之力度,或高于作为审核主体的编辑个人知识水平和素质,易出现编辑主体专业技能和数字素养的提升跟不上AIGC创新和迭代的情况。
为了更好解决上述问题,出版业尤其需要强化智能编校系统的研发和应用,在自动纠错系统、敏感词识别与排查系统、协同编纂系统等方面开展持续的技术攻关和应用落地,并主动推动“人工审核→人机互补协同审核→人机混合协同审核→人机融合协同审核→人机整体协同审核” 的路径生成与演进。对此,首先,须确立人机共生的理念,理解并运用“(人-技术)→ 世界”的具身关系。随着数字技术赋能和赋权的深入,技术的融合性逐渐增强,技术不断具身至人们的实践之中,人们也借助技术实现感知、表达和行动,技术与人类个体不断融合并赋予人类个体充分使用技术的能力。就审校活动来讲,出版编辑借助智能审校、协同编纂等技术,将快速识别敏感词、自动纠错、异时异地 协同编纂等技能不断融入自身,实现了数字技术赋能 自我,从而能够更快速、更有效、更高质量地完成图书编校任务。其次,需重视智能审校工具系统的运用,以弥补人工审校的短板和不足。基本思路是以AI工具来审核、校对AIGC作品,依托智能审核工具识别文稿的语义错误、语法错误、敏感词汇等,借助智能校对系统校异同、校是非,以提升文稿的编校质量。换言之,以机器审核机器生成的内容,以AI审核生成式智能出版物。实践中,人民日报AI智能编辑部、方正电子公司的 “智能编校排”系统、知识产权出版社的“中知编校”系统已经成功研发,并在数百家报纸、期刊和出版社中得以应用。最后,人机融合协同审核是生成式智能出版的现实方案。人机融合协同审核是人机融合智能的具体应用,其关键在于将人类智慧和机器计算能力相结合,将编辑人工审核经验知识和机器审核海量数据有机融合,以及将编辑价值判断和机器算法相匹配协调,从而做到主流价值驾驭算法训练。
3.3 基于生成式AI的印刷场景创新
在印刷环节,随着生成式AI技术的应用,智能印刷流程将进一步健全,智能印刷场景也将进一步丰富和拓新。这里涉及以下几方面。
(1)编校环节与印刷环节的数字化衔接。一直以来,出版编校环节和印刷环节在物理空间上是畅通的,而在网络空间上则是异步、隔离的,这种局面往往出于对出版内容安全、数据安全的考量。然而,如果缺乏数字化、智能化、协同化的编校印刷系统,而仍旧依靠胶片传送、邮箱发送或拷贝印刷文件来实现二者的衔接,就无法真正称之为智能印刷。事实上,基于智能软硬件的智能印刷还未真正达到智能化水平,需辅以智能化ERP管理系统来落实。由此,至少对出版与印刷隶属同一单位的出版企业而言,编校印一体化、协同化、智能化的生产管理系统是智能印刷的重要组成部分。生成式AI技术则能够为智能化的生产管理系统提供业务咨询、出版内容、多模态文件、用户数据等,甚至是可以协助进行智能化生产管理系统的代码编写。
(2)生成式AI技术引领和驱动按需印刷业务。基于ChatGPT等生成式AI程序,用户能够通过对话和检索提出个性化、定制化的知识需求,并得到某个特定行业或领域的专属知识问题解答或知识解决方案。这种 AIGC作品或解决方案,正满足了用户各取所需的数据或知识需求,并可进一步通过和印刷的深度融合,即按需咨询、按需检索和按需印刷的融合,持续衍生出多样化的按需印刷场景和业务。
(3)生成式AI技术服务智能印刷厂建设。ChatGPT的蹿红,也带动了印刷行业布局AI应用和智能工厂建设的热度,多家印刷包装上市公司纷纷借助AIGC技术开展智能选品、广告智能输出和投放、印刷客服智能回复等业务。AIGC技术在智能印刷厂方面起到的主要作用还是检索、咨询和输出,体现为:其一,担任“ AI虚拟厂长”或“智能语音机器人”,实现语音交互,对订单执行、原材料和库存等生产经营数据进行智能查询和预警分析;其二,用于智能客服咨询,减少人力资源投入,提升在线客服效率和售后服务水平;其三,智能广告和营销文案输出,增强印刷广告文案水平,提升印刷工作的营销效率。目前,AI技术在智能印刷厂建设方面所起到的作用仍是辅助性的,要真正实现智能印刷厂的自动化、智能化和提升良品率、提高生产效率的融合,则还需要不断地思考、探索和实践。
3.4 基于生成式AI的营销变革
ChatGPT等LLM对出版营销环节的多维变革和多角度赋能,也是AIGC作用于出版业的题中之义。
其一,对ChatGPT等预训练语料集的熟练运用,能够有效提升出版营销规划力、品牌建设力、产品认知力、竞品分析力,从而提高出版营销编辑的数字化营销素质和能力。在海量无标注文本优势的基础上,聘请数十名出版专家进行数据标记,以充分发挥有标注的、带有出版“烙印”的人工标注数据优势;通过对语料库中的国内外出版机构、出版领域、出版业态的战略规划、品牌构成、产品体系、核心竞争力等加以分析,经过RLHF的训练,形成可借鉴的出版营销战略规划或营销建议,以提升出版营销编辑的数字化素养和专业营销技能,为出版营销环节的提质增效注入主体动力。
其二,有助于创建原创性的营销文档,提高图书营销效率和质量。在分析式AI的加持下,出版营销环节基于海量用户数据优势以及用户精准画像,涌现出了大数据营销、网络直播营销、视频号营销等多元化营销方式,提升了出版营销效率和效能,推动了出版营销的数字化改革与升级。但与此同时,这些营销形态也暴露出一些不足,如“网红主播虽然熟谙直播规律,但是难以驾驭专门的学科知识,对图书价值认识不足,图书的文化属性往往被忽略”。进一步分析可知,网红直播所用的营销文案,往往在图书营销的针对性方面有所不足,与专业图书营销文案相比存在一定差距,而基于AIGC的营销文案则能够解决图书营销的精准性、适配性问题,可基于目标领域的特征训练模型,如针对图书产品的供给侧和需求侧进行上下游文案设计,实现商品营销文案的智能生成和自动推送。并且, AIGC模型生成的营销文案,能够综合调用语料库的文字、图片、音频、视频、3D模型甚至是虚拟环境软件等多模态素材,在丰富出版营销文案形式的同时,提高全媒体营销文案设计的效率。此外,AIGC模型还可生成论文长摘要,根据目标用户的知识问题需求,准确提炼出期刊文章的精华部分,在编辑“不在场”的情境下有效提升期刊文章营销效率。
其三,有利于推动出版数据建设,提升出版内容数据、用户数据和交互数据建设水平,推动客户关系管理系统的建立和完善,为高质量出版营销奠定基础。涵盖上百种语言、囊括大量期刊图书、多达上万亿参量的ChatGPT语料库,本身就蕴涵着古往今来规模最大、数据最全的出版内容数据;同时,对多达上亿用户数据的采集、统计和分析,也有利于摸清用户的阅读偏好、消费倾向、个人特征等,以此确定用户的基本数据和阅读数据,从而推动用户数据建设;最后,每月多达数百万用户的评论、点赞、交流等交互数据,对其进行学习、理解、分析和计算,也将有助于把握用户的学习和阅读需求,便于针对性地提供出版产品服务,从而推动出版产品营销工作的优化和改善。在拥有出版内容数据、用户数据和交互数据的基础上,对其进行负责任地使用和创新利用,可进一步形成客户关系管理系统,形成出版客户数据资产,这是出版营销工作高质量推进的基础。值得说明的是,客户关系管理系统建设是工匠精神在出版营销环节的体现,也是出版高质量发展的重要数字基础设施。
此外,基于AIGC的虚拟客服或虚拟数字人,可以24小时全方位、全天候地提供图书推荐和售后服务。生成式AI的主要应用场景之一便是根据用户个性化的提问,提供客服咨询,进行智能回答。由此,将ChatGPT等智能聊天机器人应用于图书推广、知识解答和售后服务,能够有效减少出版营销环节的人力资源投入,提升出版营销服务效能,改善目标读者的用户体验,增强目标用户的粘性和忠诚度,从而持续改进、优化和完善出版营销工作。
4 结语 |
ChatGPT的到来,使AI在通往强AI的道路上实质性地跨越了一大步。在海量数据语料库、RLHF和持续超强算力支持下,生成式AI取得了世人瞩目的成绩,也在AI发展史上浓墨重彩地描绘了一笔。较分析式AI,生成式智能出版流程智能革新涵盖了从PGC到AIGC、从人工编校到人机协同智能编校、基于生成式智能的印刷场景创新以及营销质量、效率和动力变革等丰富内容,以上权作一家之言,望方家指正。有关生成式智能出版的新产品新业态、面临的调节与治理路径等议题的分析,将在后续展开。
*参考文献略,请详见原文。 |
END
版式设计
陆澜
制版编辑
王淳洋
关注公众知识状态 / 引领学科发展潮流 Focusing on the State of Public Knowledge Leading the Development Trends of the Discipline |
网络首发 | 生成式人工智能治理行动框架:基于AIGC事故报道文本的内容分析
网络首发 | AIGC介入知识生产下学术出版信任机制的重构研究
网络首发 | 子代教育水平、反哺途径与老年人数字接入鸿沟
网络首发 | 基于扎根理论的数字反哺机制探析 ——以子代的视角
网络首发 | 2023年信息资源管理学科发展战略研讨会纪要